30 research outputs found

    Building an effective and efficient background knowledge resource to enhance ontology matching

    Get PDF
    International audienceOntology matching is critical for data integration and interoperability. Original ontology matching approaches relied solely on the content of the ontologies to align. However, these approaches are less effective when equivalent concepts have dissimilar labels and are structured with different modeling views. To overcome this semantic heterogeneity, the community has turned to the use of external background knowledge resources. Several methods have been proposed to select ontologies, other than the ones to align, as background knowledge to enhance a given ontology-matching task. However, these methods return a set of complete ontologies, while, in most cases, only fragments of the returned ontologies are effective for discovering new mappings. In this article, we propose an approach to select and build a background knowledge resource with just the right concepts chosen from a set of ontologies, which improves efficiency without loss of effectiveness. The use of background knowledge in ontology matching is a double-edged sword: while it may increase recall (i.e., retrieve more correct mappings), it may lower precision (i.e., produce more incorrect mappings). Therefore, we propose two methods to select the most relevant mappings from the candidate ones: (1)~a selection based on a set of rules and (2)~a selection based on supervised machine learning. Our experiments, conducted on two Ontology Alignment Evaluation Initiative (OAEI) datasets, confirm the effectiveness and efficiency of our approach. Moreover, the F-measure values obtained with our approach are very competitive to those of the state-of-the-art matchers exploiting background knowledge resources

    SIFR BioPortal : Un portail ouvert et gĂ©nĂ©rique d’ontologies et de terminologies biomĂ©dicales françaises au service de l’annotation sĂ©mantique

    Get PDF
    National audienceContexte – Le volume de donnĂ©es en biomĂ©decine ne cesse de croĂźtre. En dĂ©pit d'une large adoption de l'anglais, une quantitĂ© significative de ces donnĂ©es est en français. Dans le do-maine de l’intĂ©gration de donnĂ©es, les terminologies et les ontologies jouent un rĂŽle central pour structurer les donnĂ©es biomĂ©dicales et les rendre interopĂ©rables. Cependant, outre l'existence de nombreuses ressources en anglais, il y a beaucoup moins d'ontologies en français et il manque crucialement d'outils et de services pour les exploiter. Cette lacune contraste avec le montant considĂ©rable de donnĂ©es biomĂ©dicales produites en français, par-ticuliĂšrement dans le monde clinique (e.g., dossiers mĂ©dicaux Ă©lectroniques). Methode & RĂ©sultats – Dans cet article, nous prĂ©sentons certains rĂ©sultats du projet In-dexation sĂ©mantique de ressources biomĂ©dicales francophones (SIFR), en particulier le SIFR BioPortal, une plateforme ouverte et gĂ©nĂ©rique pour l’hĂ©bergement d’ontologies et de terminologies biomĂ©dicales françaises, basĂ©e sur la technologie du National Center for Biomedical Ontology. Le portail facilite l’usage et la diffusion des ontologies du domaine en offrant un ensemble de services (recherche, alignements, mĂ©tadonnĂ©es, versionnement, vi-sualisation, recommandation) y inclus pour l’annotation sĂ©mantique. En effet, le SIFR An-notator est un outil d’annotation basĂ© sur les ontologies pour traiter des donnĂ©es textuelles en français. Une Ă©valuation prĂ©liminaire, montre que le service web obtient des rĂ©sultats Ă©quivalents Ă  ceux reportĂ©s prĂ©cedement, tout en Ă©tant public, fonctionnel et tournĂ© vers les standards du web sĂ©mantique. Nous prĂ©sentons Ă©galement de nouvelles fonctionnalitĂ©s pour les services Ă  base d’ontologies pour l’anglais et le français

    Utilisation des ressources de connaissances externes pour améliorer l'alignement d'ontologies biomédicales

    No full text
    Life sciences produce a huge amount of data (e.g., clinical trials, scientific articles) so that integrating and analyzing all the datasets related to a given research question like the correlation between phenotypes and genotypes, is a key element for knowledge discovery. The life sciences community adopted Semantic Web technologies to achieve data integration and interoperability, especially ontologies which are the key technology to represent and share the increasing amount of data on the Web. Indeed, ontologies provide a common domain vocabulary for humans, and formal entity definitions for machines.A large number of biomedical ontologies and terminologies has been developed to represent and annotate various datasets. However, datasets represented with different overlapping ontologies are not interoperable. It is therefore crucial to establish correspondences between the ontologies used; an active area of research known as ontology matching.Original ontology matching methods usually exploit the lexical and structural content of the ontologies to align. These methods are less effective when the ontologies to align are lexically heterogeneous i.e., when equivalent concepts are described with different labels. To overcome this issue, the ontology matching community has turned to the use of external knowledge resources as a semantic bridge between the ontologies to align. This approach arises several new issues mainly: (1) the selection of these background resources, (2) the exploitation of the selected resources to enhance the matching results. Several works have dealt with these issues jointly or separately. In our thesis, we made a systematic review and historical evaluation comparison of state-of-the-art approaches.Ontologies, others than the ones to align, are the most used background knowledge resources. Related works often select a set of complete ontologies as background knowledge, even if, only fragments of the selected ontologies are actually effective for discovering new mappings. We propose a novel BK-based ontology matching approach that selects and builds a knowledge resource with just the right concepts chosen from a set of ontologies. The conducted experiments showed that our BK selection approach improves efficiency without loss of effectiveness.Exploiting background knowledge resources in ontology matching is a double-edged sword: while it may increase recall (i.e., retrieve more correct mappings), it may lower precision (i.e., produce more incorrect mappings). We propose two methods to select the most relevant mappings from the candidate ones: (1) based on a set of rules and (2) with Supervised Machine Learning. We experiment and evaluate our approach in the biomedical domain, thanks to the profusion of knowledge resources in biomedicine (ontologies, terminologies and existing alignments).We evaluated our approach with extensive experiments on two Ontology Alignment Evaluation Initiative (OAEI) benchmarks. Our results confirm the effectiveness and efficiency of our approach and overcome or compete with state-of-the-art matchers exploiting background knowledge resources.Les sciences de la vie produisent de grandes masses de donnĂ©es (par exemple, des essais cliniques et des articles scientifiques). L'intĂ©gration et l'analyse des diffĂ©rentes bases de donnĂ©es liĂ©es Ă  la mĂȘme question de recherche, par exemple la corrĂ©lation entre phĂ©notypes et gĂ©notypes, sont essentielles pour dĂ©couvrir de nouvelles connaissances. Pour cela, la communautĂ© des sciences de la vie a adoptĂ© les techniques du Web sĂ©mantique pour rĂ©aliser l'intĂ©gration et l'interopĂ©rabilitĂ© des donnĂ©es, en particulier les ontologies. En effet, les ontologies reprĂ©sentent la brique de base pour reprĂ©senter et partager la quantitĂ© croissante de donnĂ©es sur le Web. Elles fournissent un vocabulaire commun pour les humains, et des dĂ©finitions d'entitĂ©s formelles pour les machines.Un grand nombre d'ontologies et de terminologies biomĂ©dicales a Ă©tĂ© dĂ©veloppĂ© pour reprĂ©senter et annoter les diffĂ©rentes bases de donnĂ©es existantes. Cependant, celles qui sont reprĂ©sentĂ©es avec diffĂ©rentes ontologies qui se chevauchent, c'est Ă  dire qui ont des parties communes, ne sont pas interopĂ©rables. Il est donc crucial d'Ă©tablir des correspondances entre les diffĂ©rentes ontologies utilisĂ©es, ce qui est un domaine de recherche actif connu sous le nom d'alignement d'ontologies.Les premiĂšres mĂ©thodes d'alignement d'ontologies exploitaient principalement le contenu lexical et structurel des ontologies Ă  aligner. Ces mĂ©thodes sont moins efficaces lorsque les ontologies Ă  aligner sont fortement hĂ©tĂ©rogĂšnes lexicalement, c'est Ă  dire lorsque des concepts Ă©quivalents sont dĂ©crits avec des labels diffĂ©rents. Pour pallier Ă  ce problĂšme, la communautĂ© d'alignement d'ontologies s'est tournĂ©e vers l'utilisation de ressources de connaissance externes en tant que pont sĂ©mantique entre les ontologies Ă  aligner. Cette approche soulĂšve plusieurs nouvelles questions de recherche, notamment : (1) la sĂ©lection des ressources de connaissance Ă  utiliser, (2) l'exploitation des ressources sĂ©lectionnĂ©es pour amĂ©liorer le rĂ©sultat d'alignement. Plusieurs travaux de recherche ont traitĂ© ces problĂšmes conjointement ou sĂ©parĂ©ment. Dans notre thĂšse, nous avons fait une revue systĂ©matique et une comparaison des mĂ©thodes proposĂ©es dans la littĂ©rature. Puis, nous nous sommes intĂ©ressĂ©s aux deux questions.Les ontologies, autres que celles Ă  aligner, sont les ressources de connaissance externes (Background Knowledge : BK) les plus utilisĂ©es. Les travaux apparentĂ©s sĂ©lectionnent souvent un ensemble d'ontologies complĂštes en tant que BK mĂȘme si, seuls des fragments des ontologies sĂ©lectionnĂ©es sont rĂ©ellement efficaces pour dĂ©couvrir de nouvelles correspondances. Nous proposons une nouvelle approche qui sĂ©lectionne et construit une ressource de connaissance Ă  partir d'un ensemble d'ontologies. La ressource construite, d'une taille rĂ©duite, amĂ©liore, comme nous le dĂ©montrons, l'efficience et l'efficacitĂ© du processus d'alignement basĂ© sur l'exploitation de BK.L'exploitation de BK dans l'alignement d'ontologies est une Ă©pĂ©e Ă  double tranchant : bien qu'elle puisse augmenter le rappel (i.e., aider Ă  trouver plus de correspondances correctes), elle peut rĂ©duire la prĂ©cision (i.e., gĂ©nĂ©rer plus de correspondances incorrectes). Afin de faire face Ă  ce problĂšme, nous proposons deux mĂ©thodes pour sĂ©lectionner les correspondances les plus pertinentes parmi les candidates qui se basent sur : (1) un ensemble de rĂšgles et (2) l'apprentissage automatique supervisĂ©. Nous avons expĂ©rimentĂ© et Ă©valuĂ© notre approche dans le domaine biomĂ©dical, grĂące Ă  la profusion de ressources de connaissances en biomĂ©decine (ontologies, terminologies et alignements existants). Nous avons effectuĂ© des expĂ©riences intensives sur deux benchmarks de rĂ©fĂ©rence de la campagne d'Ă©valuation de l'alignement d'ontologie (OAEI). Nos rĂ©sultats confirment l'efficacitĂ© et l'efficience de notre approche et dĂ©passent ou rivalisent avec les meilleurs rĂ©sultats obtenus

    Une Ontologie des Processus MĂ©tier (BBO) pour guider un Agent Virtuel

    Get PDF
    National audienceLes activitĂ©s de recherche dans le domaine de la ModĂ©lisation de Processus MĂ©tier ont donnĂ© lieu Ă  diffĂ©rentes propositions de modĂšles et ontologies, certains Ă©tant reconnus comme standards. Mais aucun de ces modĂšles n’est, Ă  notre connaissance, sufïŹsamment riche pour permettre Ă  un agent virtuel de superviser l’exĂ©cution d’un processus mĂ©tier et d’exploiter des Retours d’EXpĂ©riences (REX) en cas d’anomalie. Notre participation au projet AVI-REX, en partenariat avec de grandes entreprises industrielles, a pour objectif de construire une telle ontologie. Le travail prĂ©sentĂ© dans cet article correspond Ă  la premiĂšre Ă©tape de la construction, Ă  savoir la description de processus mĂ©tier, avec toutes les connaissances requises pour leur exĂ©cution. Pour rĂ©pondre aux besoins spĂ©ciïŹĂ©s, nous nous sommes basĂ©s sur plusieurs modĂšles existants, que nous avons intĂ©grĂ©s puis enrichis. L’ontologie obtenue, appelĂ©e BBO, a Ă©tĂ© Ă©valuĂ©e selon diffĂ©rents critĂšres, puis mise Ă  disposition de la communautĂ©

    BBO: BPMN 2.0 Based Ontology for Business Process Representation

    Get PDF
    National audienceAny industrial company has its own business processes, which is a number of related tasks that have to be executed to reach well-defined goals. In order to analyze, improve, simulate and automate these processes, it is essential to represent them in a formal way. The activity of representing business processes is known as Business Process Modelling(BPM); it is an active research area that attracts more and more attention with the emergence of Industry 4.0. Semantic Web technologies, especially ontologies, are promising means to advance BPM and to realize the Industry 4.0 vision. In this scope, we developed the BBO (BPMN 2.0 Based Ontology) ontology for business process representation, by reusing existing ontologies and meta-models like BPMN 2.0, the state-of-the-art meta-model for business process representation.We evaluated BBO using schema metrics, which showed that it was a deep and rich ontology with a variety of relationships. Thanks to a use case,we illustrated the ability of BBO to represent real business processes in a fine-grained way and to express and answer the competency questions identified at the specification stage

    Comparing Business Process Ontologies for Task Monitoring

    Get PDF
    International audienceBusiness process (BP) modelling is an active area of research due to its multiple applications. For systems that support/monitor operators to perform their tasks (i.e., tasks of a given BP), a formal representation is essential. Various BP ontologies are available to formally represent BP. In this paper, we review and compare a set of nine BP ontologies according to their ability to represent process specification and process execution in a fine-grained way to enable task monitoring. The comparison shows that, on the one hand, ontologies developed from scratch establish a clear distinction between process specification and process execution, but do not allow to represent workflow constraints required for process execution. On the other hand, most of the ontologies, that are ontological versions of existing BP modeling languages, focus only on process specifications but do not represent process execution, or mix the representation of BP specification and execution

    RĂ©conciliation d'alignements multilingues dans BioPortal

    No full text
    International audienceDe nos jours, les ontologies sont souvent développées de maniÚre multilingue. Cependant, pour des raisons historiques, dans le domaine biomédical, de nombreuses ontologies ou terminologies ont été traduites d'une langue à une autre ou sont maintenues explicitement dans chaque langue. Cela génÚre deux ontologies potentiellement alignées mais avec leurs propres spécificités (format, développeurs, versions, etc.). Souvent, il n'existe pas de représentation formelle des liens de traduction reliant les ontologies traduites aux originales et ils ne sont pas accessibles sous forme de linked data. Cependant, ces liens sont trÚs importants pour l'interopérabilité et l'intégration de données biomédicales multilingues. Dans cet article, nous présentons les résultats d'une étude de réconciliation des liens de traduction entre ontologies sous forme d'alignements multilingues. Nous avons réconcilié et représenté à l'aide de vocabulaire du web sémantique, plus de 228K mappings entre dix ontologies anglaises hébergées sur le NCBO BioPortal et leurs traductions françaises. Ensuite, nous avons stocké à la fois les ontologies et les mappings sur une version française de la plate-forme, appelée SIFR BioPortal, pour rendre le tout disponible en RDF (données liées). La réconciliation des alignements s'est avérée plus complexe que ce qu'on pourrait penser car les traductions ne sont que rarement l'exacte copie des originales comme nous le discutons. Mots-clés : Mappings ou alignements multilingues, réconciliations de mappings, web sémantique, données liées, alignement d'ontologies, entrepÎt d'ontologies, ontologies biomédicales, BioPortal, interopérabilité et intégration de données, diffusion de données et de connaissances

    A FAIR Core Semantic Metadata Model for FAIR Multidimensional Tabular Datasets

    No full text
    International audienceTabular format is a common format in open data. However, the meaning of columns is not always explicit which makes if difficult for non-domain experts to reuse the data. While most efforts in making data FAIR are limited to semantic metadata describing the overall features of datasets, such a description is not enough to ensure data interoperability and reusability. This paper proposes to reduce this weakness thanks to a (FAIR) core semantic model that is able to represent different kinds of metadata, including the data schema and the internal structure of a dataset. This model can then be linked to domain-specific definitions to provide domain understanding to data consumers

    Un modĂšle sĂ©mantique en vue d’amĂ©liorer la FAIRisation des donnĂ©es mĂ©tĂ©orologiques

    No full text
    National audienceMaking meteorological data FAIR in order to ease its reuse is a strategic issue because this data is essential to advance research in many fields. This work proposes a semantic model which combines a metadata model and a data model for describing meteorological observation data. Indeed, modeling (meta)data is an essential step towards their FAIRification. We use the SYNOP open dataset made available by MĂ©tĂ©o-France to illustrate how difficult data access and understanding can be, and how the use of the proposed model to represent meteorological data improves their compliance with the "F", "I" and "R" principles.Rendre les donnĂ©es mĂ©tĂ©orologiques FAIR pour faciliter leur rĂ©utilisation est un enjeu stratĂ©gique car ce sont des donnĂ©es essentielles Ă  la recherche scientifique dans de nombreux domaines. Cet article propose un modĂšle sĂ©mantique associant un modĂšle de mĂ©tadonnĂ©es et un modĂšle de donnĂ©es pour dĂ©crire les donnĂ©es mĂ©tĂ©orologiques d’observation. En effet, la modĂ©lisation des (mĂ©ta)donnĂ©es est une Ă©tape essentielle vers leur FAIRisation. Nous utilisons le jeu de donnĂ©es "SYNOP" de MĂ©tĂ©o-France pour illustrer les difficultĂ©s liĂ©es Ă  l’accĂšs et Ă  la comprĂ©hension de ce type de donnĂ©es, et pour montrer comment le modĂšle proposĂ© amĂ©liore leur adhĂ©sion aux principes "F", "I", et "R"

    Towards the FAIRification of Meteorological Data: a Meteorological Semantic Model (MTSR 2021)

    No full text
    International audienceMeteorological institutions produce a valuable amount of data as a direct or side product of their activities, which can be potentially explored in diverse applications. However, making this data fully reusable requires considerable efforts in order to guarantee compliance to the FAIR principles. While most efforts in data FAIRification are limited to describing data with semantic metadata, such a description is not enough to fully address interoperability and reusability. We tackle this weakness by proposing a rich ontological model to represent both metadata and data schema of meteorological data. We apply the proposed model on a largely used meteorological dataset, the "SYNOP" dataset of Météo-France and show how the proposed model improves FAIRness
    corecore